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Beschreibung 



Spracherkenner und Betriebsverf ahren fa r 



einen solchen 



5 Die Erfindung betrifft einen Spracherkenner nach dem Oberbe- 
grxff des Anspruchs 1 sowie ein Betriebsverf ahren fur einen 
solchen. 

Nachdem sich die Spracherkennung bei der Texteingabe in auf 
10 PCs laufenden Buroapplikationen seit Jahren ein festes und 
stetig wachsendes Anwendungsgebiet gesichert hat, dringt sie 
zunehmend audi in die Steuerung technischer .Gerate ein So 
wohl bei hochgradig miniaturisierten und zugleich computeri- 
is TtT\ hand9ehaltenen elektronischen Geraten - insbesondere 
15 Mobxltelefonen und PDAs - als auch bei technischen Geraten 

deren Bedienung moglichst W enig Aufmerksamkeit und Konzentra- 
txon des Bedieners binden sollen - wie der verschiedenen 
technxschen Gerate in einem fahrenden Auto - kann diese Art ' 
der Spracherkennung, mit darauf aufbauender Sprachsteuerung 

I tTn Lr-t 5 "^ 1 ' 011 " 6 ^ 611 f±nden - ** ^ "-genannte 9 ; 

AtclTslTi namliCh BSdienVOr ^ verfogbare 

Flache so klexn geworden, dali. sich die Vielzahl m6gl ic her 

Funktionen durch herk6mmliche Tastatur- oder TouchScreen- 

E^ngaben nur noch sehr unbequem (und far Personen mit 

schlechtem SehvermSgen nahezu uberhaupt nicht mehr, realisie- 

ren l* fit . Bei Einsatzfeldern, in denen die Auf mer kLke lt des 

Benutzers auf andere Dinge <z. B. den StraAenverkehr, geric" 

tet blexben mufl, erbringt die Einftihrung der S P rachste!Iruna 

30 ht;Lut ch K r rtsteigerun9 - ch — ~ 



35 



In der Spracherkennung wird ein Lexikon mit den zu erkennen 

te e „ n :; r r ic e h r e n r n6tigt - D±ese werden im ^ - 

ten Spracherkennung mittels einem Text-to-Phonem-Verfahr.n 
eine phonetische Umschrift Uberfuhrt und im VokLllIr 1 " 
legt. Wahrend des Erkennungsvorgangs erf oil i ^ 
Viterbi-Aigorithmus eine slche LT^^ 
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im Vokabular enthaltenen Phonemfolgen. Einzelheiten zu den 
etablierten Spracherkennungsalgorithmen finden sich in der 
einschiagigen Fachliteratur . 

5 Weitgehend computerisierte technische Gerate der oben ange- 
sprochenen Art (PDAs, Handheld-PCs, Mobiltelef one, Kfz-Audio- 
anlagen, Kf z-Borcomputer etc.) haben vielfach an PC-Bedien- 
oberfiachen angelehnte Strukturen der Benutzerschnittstellen 
bzw. MMIs. Es 1st eine Mehrzahl von Applikationen instal- 
10 liert, die auf geeignete Weise - und bei komplexeren Geraten 
auch in einer bestiromten, logischen hierarchischen Unterord- 
nung - angesteuert werden mUssen. Bei herkommlichen Geraten 
dieser Art wird hierzu eine Menusteuerung angeboten, die vom 
Benutzer durch Sof tkey-Eingaben ausgefUhrt wird. 

15 

Bei der Applikationswahl per Spracheingabe befinden sich im 
Lexikon die Programmnamen der verfUgbaren Applikationen. Nach 
der Erkennung eines Namens wird das jeweilige Programm ausge- 
fiihrt bzw. die Applikation gestartet; Dazu mussen die Pro- 
20 grammnamen und die Programmpf ade in einem geeigneten ■ Format 
abgespeichert sein. 

Gemaft dem Stand der Technik werden die einzelnen Programmna- 
men mit den entsprechenden Erkennungsresultaten (den Worten 
25 des Lexikons) fest verdrahtet. Dies kann einerseits in einer 
zusatzlichen Datei festgelegt werden Oder andererseits fest 
im Quellcode des Programms definiert sein. Beide Methoden ha- 
ben entscheidende Nachteile, welche im folgenden beschrieben 
werden: 

30 

- Beim Arbeiten mit einer zusatzlichen Datei besteht das Pro- 
blem, dafi diese von einem Benutzer einsehbar ist und demzu- 
folge auch verandert werden kann. Auch binare Formate oder 
schreibgeschatzte Dateien bieten keinen wirksamen Schutz vor 
35 Veranderungen. Dadurch kdnnen Diskrepanzen zwischen dem ver- 
wendeten Vokabular und der Wortliste bzw, Programmliste ent- 
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stehen Dies hat auch 2U r Folge, d afl die Appl ikation m0gli _ 
cherweise falsch reagiert. 9 

lilt d * r / eStlegUn9 313 Steue ^efehle wirkenden sprach- 
lxchen Aufierungen xm Quellcode kann das Vokabular auf einfa 
chem Wege nicht weiter geandert werden. Es mu6te der 

^TTJ^ GberSetzt und ausgeliefert werden , 

sobald Anderungen der Programmnamen auftreten. 

- Der entscheidende Nachteil des bisherigen Vorgehens lieat 
xn der fehlenden bzw. unzureichenden Erweiterbarkeit des Sys- 
terns. Bisher icf t. ^ . . ^jr* 



Bisher ist es dem Benutzer nicht moglich sein* 
Ko^nandos Oder Anwendungen in die auto^atL^'s^ache™ 
nung mit aufzunehmen - jedenfails nicht ohne die Gefahr einer 
ITrlZ^ — des^^ 

Der Erf indung liegt daher die Aufgabe der Bereitstellung ei- 
nes.verbesserten Spracherkenners .und Ve.fahrens zum Betrieb 
ernes solchen zugrunde, mit denen dieser zur Berucksilhtio 
von eigenen Steue.bef ehlen oder Anwendungen ,1^^ ^ 
xxbler konfiguriert werden kann. Nutzers fie- 

Diese Aufgabe wird in ihrem Vorrichtungsaspekt durch einen 
spracherkenner mit den Merkmalen des Anspruchs 1 und In ih 
Verfahrensaspekt durch ein Betriebsverfahren It Ten Z^T 
len des Anspruchs 6 gelost. Merkma- 

SpLch^teur SChlieGt Gedanken ein, zur 

Sprachsteuerung von Applikationen - bzw. zu einer entsnr/ 
che nden dhabung _ Dateien _ ^llll^l 

Benutzeroberflache bereitzustellen Das n rn • UIget3aute 

Tl r , erM91icht ohne mUe :;:-^;:;::~ ! 

und pro^ert warden ZU ° rdnU " 9 
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Die Liste der zu erkennenden Worter (das Lexikon) wird durch 
den Inhalt eines bestimmten Dateiverzeichnisses bestimmt, in 
welchem Links (Verknilpfungen) zu den vorhandenen Programmen 
bzw. Dateien enthalten sind. Der Name des Links gibt das zu 
5 erkennende Wort an, und das Programm bzw. die Datei, auf die 
dieser Link zeigt, gibt die auszufiihrende Aktion an. Bei der 
Umsetzung des Namens sollte darauf geachtet werden, daft nur 
der Teilstring vor dem ersten Punkt als Kommando verwendet 
wird. Beim Start des Erkennerprogramms wird das Vokabular er- 
10 zeugt. So kann flexibel auf Anderungen der Applikations- bzw. 
Dateistruktur reagiert werden. Sobald ein Wort erkannt wird, 
wird der entsprechende Link aktiviert und die gewOnschte Ak- 
tion ausgefUhrt. 

15 Vorteile gegenuber dem bisherigen Verfahren sind in der Fle- 
xibilitat, was Worte und Aktionen betrifft, und der einfachen 
Erstellung und Veranderung eines komplexen Erkennerwortschat- 
zes zu sehen. Das HinzufUgen von neuen Kommandos zum bisheri- 
gen Wortschatz kann einfach und in gewohnter Weise . durchge- 

20 fiihrt werden. Im Dateiverzeichnis mufi lediglich eine Verkniip- 
fung zum gewUnschten Programm oder der Datei erstellt werden. 
Unter Windows z. B. ist das Erstellen eins Links einfach (iber 
das Kontextmenti maglich. 

25 Damit wird ein weitere Vorteil klar: Da das Filesystem die 

Verwaltung von Kommandos und Aktionen (Name und Ziel der Ver- 
kniipfung) ttbernimmt, ist kein zusatzliches Programm zur Ver- 
waltung des Wortschatzes nStig. Soil ein Kommando geloscht 
werden, wird einfach der Link geldscht. 

30 

Da moderne Betriebssysteme auch Links auf Dateien erlauben, 
kSnnen Dokumente ebenfalls per Sprach kommando geoffnet wer- 
den. 

35 In einer bevorzugten Ausfuhrung umfaftt das Dateiverzeichnis 

eine Mehrzahl von Unterverzeichnissen in mindestens einer un- 
tergeordneten Hierarchieebene, wobei die Verzeichnisnamen ein 
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erstes und gegebenenfalls weitere, hierarchisch untergeordne 
te aktive Teilvokabulare des Spracherkenners bilde! > 

Durch die Verwendung von Unterverzeichnissen im Dateiver- 
5 zeichnis lassen sich auf einfachste Weise strukturierte 

Sprachaufrufe von Progranunen und Dateien erzeugen. So kannen 
slv>\tallT T MUSikStUcken in ein "nterverzeichnis »„ u - 

findet h h ' StUfe d6r SrKennung be- 

findet sich das Wort "Musik" im aktiven Vokabular. Wird die- 
10 ses erkannt, wird das Vokabular gewechselt fz r „ , 

stehen nun im aktiven Vokabular. 

insbesondere ist jedem Programm bzw. jeder Datei aus einem 
15 Unterverzeichnis ein zusammenhSngender, mehrgliedriger 
Sprachbefehl zugeordnet, der die Namen der zu dem pJIL 
bzw. der Datei fahrenden Links des Date^er^ 
Dedes nachgeordneten Unterverzeichnis ses umfaBt " 

20 Mit dieser Methode lassen sich in einfachster Weise kom Dl 

Sprachkommandos erstellen und editieren. Vorhande ne ^e ic T 
nisse mit verknupfungen, wie z. B. das Windows StarJet 
lassen sich nun einfach per Sprachsteuerung bedienen da 

^ schon alle natigen Informationen vorhanden sind 

Dieses Verfahren ist eine Weiterentwicklung von Verknunf,, 
-t Progranunen (Beispiel Windows PC) und den T.^S^T 
Spracherkennerressourcen. Hierbei „ ird durch ^Z Tnll 
Links automatisch die Erkennerressource erstellt D h h 



35 



Generell kSnnen beliebige Dateien und Programme n^hn 

» das spezielle Verzeichnis kopi ert wurdln T!' T T 

gestartet werden. Es ist also egal ob k Spr3Chbefehl 

siktitel, eine c ++Dat ei lin Teltd', " ^ MU " 

u ^ , Textdokument oder urn ein Pm 

gramm handelt. Durch das Abspeichern e in« t- „ 

speicnem exnes Links in dem spe- 
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ziellen Verzeichnis wird die Datei durch das eingestellte De- 
faultprogramm geoffnet. Beispiel: Ein Dokument mit der Endung 
.doc wird automat isch mit dem Programm Word ge5ffnet (wie 
beim Doppelkiick mit der Maus auf die Datei bei einer her- 
5 kommlichen PC-Eingabe) . 

Die oben erlauterten Aspekte der Erfindung stellen sich so- 
wohl als Vorrichtungsaspekt eines Spracherkenners wie auch 
als Aspekte des Betriebsverf ahrens eines solchen dar - zumal 
10 die Realisierung typischerweise in einer , geeigneten Mischung 
aus Hard- und Sof twarekomponenten erfolgen wird. 

Nachfolgend sind zwei Arten, ein Wort in das Erkennerlexikon 
auf zunehmen r genannt : 

15 

(1) Aufnahme durch einen Programmauf ruf Uber das KontextmenU 
fiir die gewunschte Anwendung. Hierbei enthait das Kontextmenu 
zwei Programmauf ruf e (Add und Remove) . Add fiigt das entspre- 
chende Programm/die Datei hinzu und Remove zeigt die Liste 

20 der Programme/ Date ien an, welche aktuell durch Sprachwahl 
ausgewahlt werden kOnhen. 

(2) Kopieren des Link der gewiinschten Anwendung in den spezi- 
ellen Ordner uber "drag 1 n 'drop" > Hierbei muB,' um ein Programm 

25 zu entfernen, in das entsprechende Verzeichnis gewechselt und 
der gewunschte Link durch "Entfernen" aus dem Verzeichnis ge- 
loscht werden. 

Die Ausfiihrung der Erfindung ist nicht auf die oben beschrie- 
30 benen Beispiele und Aspekte beschrankt f sondern ebenso in ei- 
ner Vielzahl von Abwandlungen mfcglich, die im Rahmen fachge- 
maiien Handelns liegen. 
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PatentansprQche 

1. Spracherkenner mit einem gespeicherten Vokabular von 2U 

erkennenden wartern zur Sprachsteuerung einer Mehrzah v 

Programmen und/oder sonstigen Dateien, denen jeweil in Wort 

des Vokabulars als Name zugeordnet 1st, 

d a d u r c h g e k e n n 2 e i c h n e t, daB 

in emem Dateiverzeichnis zu jedem Program bzw. jeder Date! 

ein Lxnk gespeichert 1st, wobei die Namen der Links ein erl 

tes aktives Teilvokabular des Spracherkenners bild en 

2. Spracherkenner nach Anspruch 1, 
dadurch gekennzeichnet. da B 

die Namen der Links durch Sprachbef ehle gebildet sind ,,„h , 4 
Links VerknOpfungen zu AppliKationsp^e^^^^ 

3. Spracherkenner nach Anspruch 1 

<<• <j- r c h g e k e „ „ , . t c h „• . 

die Namen der Links durch Sprachbef ehl. gebildet sind , m H ... 
L.nks Verkndprungen *u Ooku»enten. insbelondere T.x«ok^ 
ten Oder Sprach-, Husik- cder Videodateien. deLniten 

.. spracherkenner nach eine* der vorangehenden Anspruche. 

. „ * 9ekennj eichnet, dao 

das Oaterverzeichnis eine Hehriahl von Unterv-rz. .,-.,„ • 
nindestens einer untergeordneten Hl mic ^^^"" » 
bar di. Na»e„ der Unterverzeichnisse zusa„„en ^t^enen'der" 
Links ein erstes und gegebenenfaUs weitere . 
tergeordnete aktive Teiivokabuiare ^^^^r 
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5. Spracherkenner nach Anspruch 4 

d • d u r c h g e k e n n z e i' c h n e t, dafi 
Dedem Programm bzw. jeder Datf-i ~- 

ein ^X^'CL^r^ 
i«. der die Nara e„ der zu de„ Program XTuateT^re"! 



200119670 



den Links des Dateiverzeichnisses und jedes nachgeordneten 
Unterverzeichnisses umfaflt. 

6. Betriebsverfahren eines Spracherkenners nach einem der 
5 vorangehenden Ansprtiche, 

dadurch gekennzeichnet, dafi 
beim Start des Spracherkennerprogramms das aktuelle Vokabular 
erzeugt wird, welches wenigstens die Namen der Links des Da- 
teiverzeichnisses umfaiit. 

10 

7. Betriebsverfahren nach Anspruch 6, 
dadurch gekennzeichnet, dafl 

die Administrierung des Vokabulars als Verwaltung des Datei- 
verzeichnisses und optional vorhandener Unterverzeichnisse, 
15 ohne zusatzliches Vokabular-Verwaltungsprogramm, erfolgt. 

8. Betriebsverfahren nach Anspruch 6 oder 7, 
dadurch gekennzeichnet r daft 

zur Editierung zusammenhangender,. mehrgliedriger Sprachbefeh- 
20 le unter dem Dateiverzeichnis Unterverzeichnisse in minde- 
stens einer untergeordneten Hierarchieebene angelegt werden 
und die Erkennung zusammenhangender, mehrgliedriger Sprachbe- 
fehle in einem mehrstufigen Erkennungsvorgang erfolgt, in 
dessen Ablauf von einem ersten in ein zweites und gegebenen- 
25 falls weitere aktive Teilvokabulare gewechselt wird. 

9. Betriebsverfahren nach einem der Ansprtiche 6 bis 8, 
dadurch gekennzeichnet, daft 

die Aufnahme neuer Worte in das Vokabular oder die Entfernung 
30 von Worten aus dem Vokabular durch einen Programmauf ruf ttber 
ein an sich bekanntes Kontextmena fur das betreffende Pro- 
gramm bzw. die betreffende Datei oder durch einen 
"drag 'n' drop" -Ablauf erfolgt. 
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Zusaramenfassung ' ^ "^ft XQIR 

Spracherkenner und Betriebsverfahren fur einen solchen 

Spracherkenner mlt einem gespeicherten Vokabular von , 
kennenden wartern zur Sprachsteueru.g einer Ihrzlhl **" 
graven und/oder sonstigen Dateien, dene ^ einT 
des Vokabulars als Na me zugeordnet 1st, uolZ ll e L n 
verzeichnis zu jede* Program bzw. jed r ^l i " 
speichert ist, wobei die Nai nen der Links e^n erst" v ^ 
Teilvokabular des Spracherkenners bild en ^ 
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